Variable dépendante ou indépendante


On parle souvent en Sciences Humaines, de « variable dépendante » et de « variables indépendantes ».
Rappelons que la variable définit les caractéristiques de la mesure que l'on utilise pour prélever l'information.

Une variable indépendante est un paramètre qui varie sans être influencé par les autres paramètres. Il en existe deux types :
- variables indépendantes invoquées : aucune action n'est possible (ex : âge, taille, etc.). C'est son choix qui déterminera la sélection des échantillons.
- variables indépendantes contrôlées : elles sont créées par l'expérimentateur (ex : luminosité, etc.) en vue d'être potentiellement répétées.

Une variable dépendante est un paramètre qui varie sous l'influence d'autres paramètres. Elle peut être mesurée ou enregistrée (ex : poids, temps de réponse, opinion, etc.).

La différence entre variable indépendante et dépendante dépend fortement du contexte. Les quelques exemples qui suivent aideront certainement à la compréhension de ce concept.

Le taux de globules blancs des hommes est-il inférieur à celui des femmes ?
- Variable indépendante = sexe
- Variable dépendante = taux de globules blancs (qui dépend du sexe)

Le sexe du crocodile dépend-il de la température d'incubation des oeufs ?
- Variable indépendante = température
- Variable dépendante = sexe (qui dépend de la température)

Les résultats en orthographe sont-ils meilleurs avec la méthode d'apprentissage A, la méthode B ou la méthode C ?
- Variable indépendante = choix de la méthode (A, B ou C)
- Variable dépendante = résultats obtenus (qui dépendent de la méthode)

Cas de plusieurs variables indépendantes

Dans le cas d'une variable dépendante (Y) quantitative et de n variables indépendantes X discrètes (les n facteurs), on parle de plan à n facteurs. Le cas le plus fréquemment rencontré est celui à 1 ou 2 facteurs.

Par exemple, Un test hématologique a été effectué sur 5 adultes normaux et 5 adultes atteints d'une maladie sanguine. A chaque individu, on injecte une quantité fixe d'un produit radioactif et on prélève, à différents temps (1, 3 et 5 minutes), un échantillon de sang dont on mesure la radioactivité.
Les deux facteurs sont l'atteinte de la maladie et le moment de la prise de mesure. La variable dépendante est la radioactivié mesurée.

Dans le cas d'une variable dépendante (Y) quantitative et de n variables indépendantes X quantitatives également, on envisage généralement la régression linéaire (multiple). Le cas le plus commun est celui à 2 variables X et Y dont on veut tester l'indépendance (par exemple le poids dépend-il de la taille ?).

Dans le cas d'une variable dépendante (Y) qualitative et de n variables indépendantes X quantitatives ou qualitatives, on envisage généralement la régression logisique. Le cas le plus fréquent est celui de la régression logistique binaire qui permet, par exemple, d'estimer l'augmentation de chances d'avoir une crise cardiaque (variable dépendante Y binainre) à chaque anniversaire supplémentaire (variable indépendante X quantitative).

Cas de plusieurs variables dépendantes

Ce cas n'est pas encore traité ici. Le plus simple est d'étudier les différentes variables séparément, en gardant à l'esprit que la multiplication des tests d'hypothèse augmente l'erreur de 1ère espèce. Par exemple au seuil 5%, si l'on effectue 3 tests d'hypothèse, la probabilité de découvrir un résultat significatif sous l'hypothèse H0 est de (1-0,95^3) = 0,143, c'est-à-dire environ 14% de chances d'observer une différence significative par hasard.
Le problème peut être partiellement contourné en travaillant avec un seuil d'erreur plus bas (par exemple 1%). Ces considérations feront l'objet de notes ultérieures.

< Précédent   Suivant >